Sora е новият генератор на текст към видео OpenAI на създателя на ChatGPT. Ето какво знаем за новия инструмент
НЮ ЙОРК (AP) — Създателят на ChatGPT в този момент се гмурка във видео, генерирано от AI.
Запознайте се със Sora — новото превръщане на текст към видео на OpenAI генератор. Инструментът, който компанията от Сан Франциско показа в четвъртък, употребява генеративен изкуствен интелект за неотложно основаване на къси видеоклипове въз основа на писмени команди.
Sora не е първата, която показва този тип технология. Но анализаторите в промишлеността показват високото качество на показваните до момента видеоклипове на инструмента и означават, че въвеждането му бележи забележителен скок както за OpenAI, по този начин и за бъдещето на генерирането на текст към видео като цяло.
И въпреки всичко, както при всички неща в бързо разрастващото се пространство на ИИ през днешния ден, такава технология също поражда страхове по отношение на евентуални етични и публични последствия. Ето какво би трябвало да знаете.
КАКВО Е SORA? МОГА ЛИ ДА Гражданско отделение ИЗПОЛЗВАМ ВЕЧЕ?
Sora е генератор на текст към видео — основава видеоклипове с дължина до 60 секунди въз основа на писмени подкани благодарение на генериращ AI. Моделът може също да генерира видео от съществуващо неподвижно изображение.
Generative AI е клон на AI, който може да сътвори нещо ново. Примерите включват чатботове, като ChatGPT на OpenAI, и генератори на изображения като DALL-E и Midjourney. Получаването на AI система за генериране на видеоклипове е по-ново и по-предизвикателно, само че разчита на част от същата технология.
Sora към момента не е налична за публично потребление (OpenAI споделя, че се ангажира с политици и актьори, преди публично да пусне инструмент) и има доста неща, които към момента не знаем. Но след известието в четвъртък компанията показа няколко образеца за видеоклипове, генерирани от Sora, с цел да покаже какво може да направи.
Главният изпълнителен шеф на OpenAI Сам Алтман също се обърна към X, платформата, известна преди като Twitter, с цел да помоли потребителите на обществените медии да изпращат навременни хрумвания. По-късно той показа видеоклипове с реалистични елементи, които дават отговор на подкани като „ два златни ретривъра, подкастиращи на върха на планина “ и „ велосипедно съревнование в океана с разнообразни животни като спортисти, каращи колела с аспект от камера с дрон “.
Докато видеоклиповете, генерирани от Sora, са в положение да изобразят комплицирани, необикновено детайлни подиуми, OpenAI отбелязва, че към момента има някои недостатъци - в това число някои пространствени и причинно-следствени детайли. Например OpenAI прибавя на своя уеб страница, „ човек може отхапете от бисквитка, само че по-късно бисквитката може да няма диря от захапване. “
ИМА ЛИ ДНЕС ДРУГИ ВИДЕО ИНСТРУМЕНТИ, ГЕНЕРИРАНИ ОТ AI?
Sora на OpenAI не е не е първият по рода си. Гугъл, Meta и стартъпът Runway ML са измежду другите компании, показали сходна технология.
Все отново анализаторите в промишлеността акцентират очевидното качество и впечатляващата дължина на споделените видеоклипове на Sora Fred Havemeyer, началник на американския AI и софтуерни проучвания в Macquarie, сподели, че стартирането на Sora бележи огромна крачка напред за промишлеността.
„ Не единствено можете да вършиме по-дълги видеоклипове, доколкото разбирам, до 60 секунди, само че и създаваните видеоклипове наподобяват по-нормални и наподобява, че в действителност зачитат повече физиката и действителния свят “, сподели Хавемайер. „ Вие не получавате толкоз доста видеоклипове или фрагменти от „ злокобна котловина “ във видео излъчванията, които наподобяват... неестествено. “
Въпреки че има „ голям прогрес “ в генерираното от AI видео през последното година — в това число въвеждането на Stable Video Diffusion предишния ноември — старши анализаторът на Forrester Роуън Къран сподели, че сходни видеоклипове изискват повече „ сглобяване “ за координация на характера и сцената.
Постоянството и дължината на видеоклиповете на Sora обаче съставляват „ нови благоприятни условия за създателите да включат детайли от видео, генерирано от изкуствен интелект, в по-традиционно наличие и в този момент даже да генерират пълноценни наративни видеоклипове от една или няколко подкани “, сподели Къран пред Асошиейтед прес по имейл в петък.
КАКВИ СА ПОТЕНЦИАЛНИТЕ РИСКОВЕ?
Въпреки че качествата на Sora изумиха наблюдаващите от стартирането в четвъртък насам, безпокойството по отношение на етичните и публични последствия от потреблението на видео, генерирано от AI, също остава.
Хейвмайер показва да вземем за пример забележителните опасности в евентуално напрегнатия избирателен цикъл през 2024 година Наличието на „ евентуално вълшебен “ метод за генериране на видеоклипове, които могат да наподобяват и звучат реалистично, съставлява редица проблеми в политиката и отвън нея, добави той – акцентирайки опасенията за машинация, агитация и дезинформация.
„ Отрицателните външни резултати на генеративният AI ще бъде сериозна тематика за спор през 2024 година “, сподели Хавемайер. „ Това е значителен проблем, с който всеки бизнес и всеки човек ще би трябвало да се изправи тази година. “
Технологичните компании към момента вземат решение, когато става въпрос за ръководство на ИИ и неговите опасности, до момента в който държавните управления по света работят за хващане нагоре. През декември Европейският съюз реализира съглашение по отношение на първите в света всеобхватни правила за ИИ, само че актът няма да влезе в действие до две години след окончателното утвърждение.
В четвъртък OpenAI съобщи, че подхваща значими стъпки за сигурност преди да създадем Sora необятно налична.
„ Ние работим с червени екипи – специалисти по домейни в области като дезинформация, насаждащо ненавист наличие и пристрастия – които ще тестват конкурентно модела “, написа компанията. „ Ние също построяваме принадлежности, които да оказват помощ за откриването на подвеждащо наличие, като да вземем за пример класификатор за разкриване, който може да разбере по кое време видеоклипът е генериран от Sora. “
Вицепрезидентът по световните въпроси на OpenAI Anna Makanju повтори това, когато приказва в петък на Мюнхенската конференция по сигурността, където OpenAI и 19 други софтуерни компании дадоха обещание да работят непринудено дружно за битка с генерираните от AI дълбоки фалшификации на избори. Тя означи, че компанията пуска Sora „ по метод, който е много внимателен “.
В същото време OpenAI разкри лимитирана информация за това по какъв начин е основана Sora. Техническият отчет на OpenAI не разкрива какви изображения и видео източници са употребявани за образование на Sora - и компанията не отговори незабавно на настояването на Associated Press за спомагателен коментар в петък.
Изданието на Sora също идва на фона на фона на правосъдни каузи против OpenAI и неговия бизнес сътрудник Microsoft от някои създатели и The New York Times за потреблението на предпазени с авторски права писмени творби за образование на ChatGPT. OpenAI заплаща неразкрита такса на Асошиейтед прес, с цел да лицензира своя списък с текстови вести.
________________
О’Брайън заяви от Провидънс, Роуд Айлънд.